30/05/2016

Aya Soffer

Directora de Investigación sobre Computación Cognitiva. IBM Research

La definición oficial, publicada por IBM, es engañosamente simple: Watson, el primer sistema de computación cognitiva «no se programa como los ordenadores actuales – explica la compañía sobre su criatura – sino que entiende el lenguaje natural de las personas, es capaz de contestar preguntas complejas a partir de su capacidad de analizar grandes volúmenes de datos estructurados y no estructurados, identificar patrones y relaciones; además de aprende de la experiencia». En realidad, la computación cognitiva está en una fase temprana, y su valor futuro se medirá por la capacidad de resolver retos en los que la informática convencional, binaria, se encuentra increíblemente limitada.

Aya Soffer

Aya Soffer

El lector recordará que Watson se dio a conocer en enero del 2011, cuando ganó un concurso de la televisión estadounidense, Jeopardy, frente a dos campeones. Un récord. En aquel momento, era (¿sólo?) un sistema capaz de digerir preguntas y buscar las respuestas posibles en una enorme base de datos, asignándoles probabilidades en función del contexto. Lo suficiente para ganar el concurso, adquirir fama y estimular la imaginación de los medios. Pero los laboratorios de IBM Research en Nueva York, Zurich y Haifa han seguido trabajando para identificar aplicaciones de la tecnología que puedan convertirse en nuevas fuente de ingresos, de los que la compañía está necesitada.

Una orientación actual de la unidad de negocio creada ad hoc por IBM es la búsqueda de ´verticales`, áreas de aplicación sectorial para esta tecnología. Ya están disponibles vía cloud una treintena de APIs, al alcance de una comunidad de desarrolladores, y la compañía ha destinado un fondo de 100 millones de dólares para invertir en startups interesadas en crea aplicaciones basadas en Watson.

A diferencia de otros mensajes que la industria arropa bajo la etiqueta de ´inteligencia artificial`, el verdadero valor de Watson no está en la pretensión de sustituir el cerebro sino en potenciar la inteligencia humana sino en potenciarla para trabajar juntos, al servicio de objetivos analíticos a gran escala. El autor de este blog tuvo recientemente oportunidad de conversar con Aya Soffer, quien dirige las investigaciones sobre computación cognitiva que IBM Research desarrolla en sus laboratorios de Haifa (Israel). Quizá lo más relevante de la charla fue su amarre a la realidad, sin recurrir a ese futurismo ramplón al que tan proclives son los medios cada vez que una crisis oscurece el presente.

A la salida del encuentro con la doctora Soffer, la definición oficial del primer párrafo se había perfeccionado en un aspecto decisivo: los sistemas cognitivos tienen una ventaja sobre los seres humanos, su capacidad de ingesta de grandes volúmenes de información, pero carecen de los atributos de juicio y de capacidad de comprender las implicaciones y consecuencias de las decisiones.

No ha de ser fácil transmitir qué es la computación cognitiva: La constante referencia de los medios a Jeopardy, parece indicar que a los periodistas nos cuesta captar la significación de Watson.

Si usted lo dice… Para nosotros, Jeopardy fue el kilómetro cero, el paso necesario para mostrar que habíamos alcanzado la manera de que una máquina comprendiera el lenguaje humano y hacer asociaciones de ideas. Es normal que los periodistas necesiten una historia en la que apoyar sus textos sobre algo tangible […]

Fue una buena historia de hace cinco años, pero la anécdota de Jeopardy se ha quedado vieja.

Igual que se ha quedado vieja la noticia de que Deep Blue le ganó una partida a Kasparov en 1997, o envejecerá muy pronto el triunfo reciente de Alpha Go […]. El valor de estas historias está en que permiten al público asimilar que las máquinas pueden aprender. En cada uno de estos hitos ha habido distintas combinaciones de capacidades, pero en la computación cognitiva la clave está en el lenguaje natural. Los ordenadores necesitan añadir a su capacidad de cálculo ese plus de comprensión: entender el lenguaje natural, asociarlo con la visión y con el habla. Esto es lo que nos permite plantearnos objetivos más ambiciosos que un concurso de TV.

Por ejemplo, en la investigación médica […]

IBM tiene acuerdos firmados con varios institutos de investigación sobre el cáncer en Estados Unidos y con un proyecto de genómica. ¿Cómo puede ayudar Watson al oncólogo, para que esté en mejores condiciones de tomar una decisión clínica? En ningún caso es Watson quien toma las decisiones; su papel es aportar al profesional las evidencias que ha reunido y decirle «estas son las opciones que he encontrado, pero ya sabrás que sólo soy una máquina…» [risas] Se ha calculado que un oncólogo necesitaría 160 horas semanales para estar al día con la literatura que se produce continuamente sobre su especialidad. Para Watson, 160 horas no son un problema […]

Cuando IBM habla de «la empresa cognitiva», ¿está tratando de ir más lejos o más a fondo que las tecnologías analíticas usuales? Algún analista ha señalado el riesgo de sustituir un negocio actual tangible sin añadir ingresos significativos…

Mi papel no es el negocio, pero puedo asegurarle que con frecuencia creciente, las empresas procesan más datos no estructurados, y que los sistemas convencionales no están preparados para ciertas misiones […] Un ejemplo que le resultará cercano es el de Caixabank, que está usando la computación cognitiva para potenciar el asesoramiento a sus clientes en materia de comercio exterior; los especialistas del banco han entrenado a Watson para que sea capaz de responder preguntas y dudas relacionadas con ese área de negocio. No se trata de un robot que reemplaza a los gestores, sino de que Watson, y sólo Watson, es capaz de asimilar la tremenda cantidad de información que ningún ser humano podría asimilar incluso valiéndose de un ordenador. Ah, por cierto, creo que la de Caixabank ha sido la primera experiencia en la que Watson ha aprendido a procesar la lengua española.

¿Cuáles serían los sectores de actividad económica más proclives, en principio?

Aparte de la salud, que ya he mencionado, diría que el primer campo de aplicación sería el sector financiero. En el fondo, el trabajo de un asesor financiero no es tan diferente del de un médico: trata de predecir lo que va a ocurrir en un mercado, diagnosticar y tomar decisiones: es perfecto para la computación cognitiva.

¿En qué se diferencia esta misión de Watson de lo que podría hacerse con un superordenador, como el Mare Nostrum, que funciona en Barcelona y es una máquina suministrado por IBM?

Hay una parte de tecnología subyacente que es común, pero lo que aporta un HPC (high performance computing) es gran capacidad computacional, que sin duda es un componente necesario pero no todo lo que se necesita. Puede «masticar» un gran volumen de números, como se hace para la predicción del tiempo, por ejemplo, pero no es idóneo para textos ni para imágenes, al menos con la misma eficiencia. Para la computación cognitiva necesitamos otra arquitectura.

[…] básicamente, que sea capaz de simulación.

Exacto. El gran salto adelante que estamos viviendo es Deep Learning, que nos permite comprender las imágenes, entre otros elementos […] como digo, lo que necesitamos es una arquitectura nueva, una infraestructura distinta a la de un HPC.

En general, la percepción pública acerca de la inteligencia artificial está muy enfocada en los robots, con lo que tiene de fascinación pero también de recelos. ¿Cree que las tecnologías cognitivas pueden ser fácilmente aceptadas por la gente corriente?

La gente corriente no va a usar Watson, que estará en manos de profesionales para ofrecer servicios que la gente apreciará. Estoy convencida de que hay muchos más beneficios que riesgos eventuales. Es un reto. Sin embargo, es cierto que todos tenemos grabadas en la mente imágenes cinematográficas muy poderosas, como Terminator, que no son tranquilizadoras: creo que deberíamos hace un esfuerzo educativo, mostrar los rasgos positivos de la inteligencia artificial. Entre otras, una de las aplicaciones que estamos desarrollando para Watson, está el reconocimiento de cómo funciona un ataque cibernético.

Machine learning es un asunto de recurrente actualidad: Amazon, Facebook, Google, Microsoft… toda la industria está trabajando en ese campo. ¿Dónde están los limites de la capacidad de aprendizaje de las máquinas? ¿Están en su arquitectura, en la sintaxis del lenguaje natural o en la capacidad humana para enseñarles?

En todo lo que ha dicho. Pero ha omitido lo que puede ser más importante: que todavía no tenemos suficientes datos…

Me sorprende. Cada día se nos dice que hay un crecimiento exponencial de datos.

Cada vez que tratamos de enseñar algo a un ordenador, necesitamos más información adicional para que la aprenda, y además necesitamos que la información sea verídica, lo que muchas veces no es posible: la calidad de esos datos tan abundantes, no siempre es la deseable. Otro límite es que realmente sabemos poco acerca de por qué los humanos somos tan buenos aprendiendo […] gracias a que tenemos intuición, sentido común y otras cualidades que los ordenadores no tienen. Hay en nuestra biología rasgos que nos hace especiales. Una máquina no es capaz de de establecer un vínculo emocional con nosotros ni con uno de sus semejantes.

¿En qué punto de su desarrollo se encuentra la computación cognitiva?

Todavía estamos en la fase de comprensión del lenguaje natural, lo que significa que nos queda mucho por recorrer. Para dialogar, los humanos necesitamos recordar, porque una conversación implica comprender no sólo lo que se dice sino lo que se ha dicho antes, y en qué contexto se ha dicho, etcétera. Si en esta sala hubiera una cámara, un ordenador corriente podría fácilmente registrar la información de que hay dos personas sentadas ante una mesa, pero no que se trata de una entrevista.

¿Qué input habría que dar a Watson para que entendiera que esto es una entrevista?

Watson aprende a través de ejemplos. Si lo alimentamos con suficientes vídeos, podemos entrenarlo para que sepa distinguir entre una entrevista de otra escena entre dos personas sentadas a una mesa […] Una persona pregunta y otra persona responde, en esto consiste una entrevista, pero la máquina no lo sabe hasta que la entrenamos para descubrirlo. Lo llamamos ingeniería del conocimiento o generar conocimiento. La mayor dificultad está en ´modelizar` ese conocimiento, para que sea aplicable en situaciones futuras.

[publicada en La Vanguardia el 29/5]


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons